#simulación social

Evaluación de agentes interactivos con un juez en línea generador de situaciones

Descubre el innovador método de juez en línea para evaluar agentes sociales generando situaciones, mejorando cobertura y fiabilidad.

2026-06-17 · 2 min

MiroBench: Evaluando el realismo en simulaciones de discusiones reales con IA

Descubre MiroBench, un benchmark que evalúa si los agentes de IA replican fielmente las dinámicas de discusiones reales en Reddit. ¿Son realmente realistas?

2026-06-16 · 3 min

MASS: Investigación Social Profunda con Simulación de Memoria

Descubre cómo MASS, un agente de simulación social con memoria, mejora la creatividad y el insight en la generación de papers de ciencias sociales.

2026-06-09 · 2 min

Piensa Antes de Hablar: De la Evaluación a la Expresión Pública

Descubre cómo el marco TBS separa el razonamiento privado de la expresión pública en simulaciones multiagente, analizando la dinámica del silencio.

2026-06-03 · 1 min